文本聚类相关论文
习近平关于网络强国重要论述的基本内容体系大体可分为技术功能认知和国家建设方略两大层面,前者深入揭示了互联网的强国功能,包括互......
以百年未有之大变局下的大国博弈为切入点,立足未来航空科技发展的军事应用需要界定国防领域航空颠覆性技术的概念内涵,遴选适合国防......
现有的专利分析系统在可视化方面存在诸多不足,针对中文专利的可视化分析工具更是少之又少。结合文本挖掘技术,设计并实现“中文专利......
为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究。然而,目前丝路文化遗产数据呈现多源异构的特性,包括......
[目的/意义]识别和把握研究前沿具有现实价值,目前基础性知识工具中,主题模型因其独特的优越性而具有较为广泛的应用,为专家研判提供......
期刊
随着5G技术的出现以及计算机技术突飞猛进的发展,通过互联网发布和获取信息变得越来越容易。面对人工难以处理信息爆炸式增长的困......
学位
当前全球种业基本形成“两超、四强、差异化发展”新格局,种业巨头主导着全球作物育种技术研发和产业发展。通过深入分析和挖掘跨国......
服务质量中乘客感知的获取和满足是提高城市轨道交通吸引力的重要依据,评价过程的科学性与结果的准确性将对优化城市轨道交通的运营......
传统的文本聚类算法通过衡量文本间相似度对数据样本进行类簇划分,但无法根据用户给定的少量监督信息挖掘用户对聚类结果的主观意图......
近年来,随着高性能通信技术和工业互联网的快速发展,各行各业都将面临PB级别数据的处理。聚类分析作为数据挖掘中一种常用的无监督......
随着各个行业都开始进行业务的数字化转型,测试作为软件生命周期中非常重要的一环,具有不可或缺的作用,但为了解决成本高、测试人......
事件抽取目的是检测文档和信息流中是否存在事件,并以结构化的方式展示事件信息。其研究任务包括辨别事件类型、抽取事件参数,以及......
文本聚类能在大量复杂的文本中精确有效地挖掘有用的信息,因此成为信息处理领域的一个研究热点。随着神经网络在自然语言处理领域研......
新闻是人们获取资讯的重要渠道,在互联网技术高度发达的今天,人们通常通过新闻app和新闻网站获取新闻,在海量的信息流中,人们对于......
2019新冠肺炎疫情爆发以来,中国人民在中国共产党的领导下,万众一心,全力抗击疫情。从2019年12月底至2020年4月初,在经历了几个阶......
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,本文提出了一种基于句向量(Doc2vec)和卷积神经网络(Convolutional Neu......
随着互联网的普及和电子商务的推广,越来越多的消费者选择网上购物。而在线评论与商家的回复可以帮助消费者了解更多关于商家和商......
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足......
舆情是社会民意的集中反映。网络舆情来源广泛,传播速度快,且海量多样。为了帮助政府机构、社会媒体能够在海量舆情文本中更有效率......
现有的文本聚类算法存在划分不准确以及同名消歧算法的冷启动性等问题。针对这些问题,本文融合多种特征提取算法提出了基于Word2ve......
随着互联网的发展,文本数据的激增,自然语言处理领域得到了良好的发展。在自然语言处理领域中,自动文本摘要生成技术是一个重要的......
随着数据爆炸时代的到来,如何高效快捷地挖掘出冗余数据中有价值的信息变得越来越重要。聚类分析是一种无标签、无监督学习的数据......
聚类算法作为模式识别、数据挖掘领域的重要研究内容,受到研究者的广泛关注。近年来,许多对团簇状的数据表现出较好性能的聚类算法......
随着信息技术的发展,互联网中涌现出了海量的文本数据,如何从这些文本数据中挖掘有价值的主题信息是文本挖掘领域中重要的研究内容......
随着信息化时代的到来,新浪微博变为超大型的社交平台,引导着网络舆论的发展方向。如何从评论中获取有效信息和情感取向,以及掌握舆论......
随着计算机行业的快速发展,人们获得的信息和采集的数据不断增加。聚类算法作为数据挖掘的一种常用工具,可以有效地分析数据之间的......
为了提高文本聚类的性能,采用k-modes算法进行文本聚类,并采用知识图谱进行样本预分析,以提高k-modes的文本聚类适用度.采用知识图......
产学研数据服务平台的科技文献数据来源于互联网文献知识库,但处理科技文献数据时不得不面对作者姓名歧义的问题。作者姓名歧义问......
社交媒体是互联网上基于用户关系的内容生产与交换平台。近几年社交媒体的迅速扩张使人们可以实时便利地了解世界上正在发生的事情......
K-means算法是进行文本聚类时使用最为广泛的一种推荐算法之一。该算法在进行文本聚类时每个属性的作用是同等的,而实际中每个属性......
针对甲骨卜辞数据,提出一种基于对称非负矩阵分解的无监督文本聚类方法,根据卜辞之间的同文关系构建卜辞邻接网络,并将其作为约束......
随着信息技术的飞速增长,网络全球化给人们带来的好处也愈加丰富,大量的英文文本携带着众多重要信息出现在种类繁多的资源当中,这......
文本在人类已产生的数据中占有极为重要的地位,如何从文本中自动发现知识是一个有着长久历史的经典问题。随着人工智能和数据科学......
计算机技术快速发展,海量的数据信息加速传播,这些数据是富有很多附加意义的,数据主要的存在方式是以文本的方式存在。现在,很多研......
随着互联网科技的迅猛发展,网民数量和上网时长日益增加,特别是“互联网+”战略的推进,互联网已日益成为公众日常工作、生活、学习......
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中......
[目的 /意义]网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文本挖掘是情报分析的重要内容.[方......
微博由于其内容传播速度的即时性和传播范围的广泛性积累了大量的用户,成为了热点事件的舆论爆发地与传播地。对于微博的某个突发......
针对新闻事件追踪中存在的遗漏相关新闻、发展脉络不连贯的问题,提出一种融合时间性与语义的专题事件脉络生成方法。通过模板化网......
本文是在对几种比较经典的聚类算法对比分析的基础上,利用自组织映射网络在拓扑保序和抗噪声能力等方面的优势,以自组织映射模型作为......
本文首先通过对受调查者使用食品终端配送车选购食物类型进行描述统计分析。为了进一步探究食品终端配送车对其他食品类型的市场,......
本文介绍了后缀数组技术及相关的基本概念,以及配合后缀组的最长公共前缀数组的构造方法,利用倍增算法构建了后缀数组,基于后缀数......
当突发公共事件发生时,如何正确引导网络舆论,消除消极的网络舆情是政府部门迫切需要解决的问题,也是舆情分析的根本目的。本文在......
该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......
该文对自动文本聚类技术的现状和发展进行了简要的回顾.阐述了文本聚类技术的应用需求和与相关领域技术的互通性及发展上的相互作......
随着Internet网络的日益普及,人们越来越依赖网络来获取各种信息,传统的信息发布和获取模式受到了巨大的冲击。同时,随着电子出版物的......
在快速进步的信息时代,人们在快速的生活节奏中能以很简单的方式用搜索引擎能够在茫茫互联网中找到较为准确的用户所需要的信息。......
随着Internet的迅猛发展,不可避免地使人们对有用信息的查找产生了巨大困难,因此文本挖掘的发展前景十分广阔,而文本聚类是文本挖......